بهبود الگوریتم های طبقه بندی مجموعه داده های نامتوازن با استفاده از روش های فازی و الگوریتم های تکاملی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده برق و کامپیوتر
  • نویسنده محبوبه مهدی زاده
  • استاد راهنما مهدی افتخاری
  • سال انتشار 1392
چکیده

طبقه بندی عملی مهم در داده کاوی و کشف دانش از پایگاه داده است. در اغلب موارد، زمانی که تلاش می کنیم تا یک طبقه بند را از داده های آموزشی یاد بگیریم، داده های آموزشی توزیع کلاس نامتوازنی دارند. مسألهی طبقه‏بندی نامتوازنِ باینری بدین صورت تعریف می شود: یک مسأله ی طبقه‏بندی است که در آن تفاوت قابل توجهی میان میزان نمونه‏های دو کلاس‎ وجود دارد. اغلب الگوریتم های یادگیری ماشین فرض می کنند که تعداد نمونه های آموزشی در کلاس های متفاوت برابر می باشند و براین اساس، یک طبقه بند را یاد می گیرند؛ بنابراین زمانی که این الگوریتم ها را به داده های نامتوازن اعمال می کنیم، طبقه بند یادگرفته شده غالباً از کلاس اکثریت منتج می شود که این موضوع به پیش بینی بسیار ضعیف از کلاس اقلیت منجر می شود زیرا آموزش کلاس اقلیت به درستی انجام نشده است. بنابراین، کنترل و حل مسأله داده ی نامتوازن برای بهبود کارایی امری ضروری است. روش های بسیاری برای مسأله یادگیری نامتوازن پیشنهاد شده است که به دو دسته ی اصلی تقسیم می شوند: نمونه گیری از داده و اصلاح الگوریتم های موجود. در این کار تحقیقاتی، از تئوری فازی و الگوریتم های تکاملی استفاده می کنیم و با استفاده از این تکنیک ها، پنج الگوریتم برای مواجهه با مسائل نامتوازن پیشنهاد می دهیم. از میان روش های ارائه شده، روش های اول تا چهارم سعی در بهبود سیستم های طبقه بندی مبتنی برقوانین فازی دارند تا این طبقه بندها با مسائل نامتوازن سازگار شوند و روش پیشنهادی پنجم با استفاده از نمونه گیری از داده ها سبب متوازن شدن مجموعه داده می شود. نتایج حاصل از اعمال این روش ها نشان دهنده ی برتری آن ها نسبت به روش هایی است که اخیراً در این حوزه ارائه شده اند. همچنین با مقایسه ی روش های پیشنهادی با یکدیگر در می یابیم که روش پیشنهادی دوم (که روشی حساس به هزینه می باشد و از تئوری فازی و دو الگوریتم تکاملی استفاده می کند) عملکرد بهتری نسبت به سایر روش های پیشنهادی دارد.

منابع مشابه

طراحی فیلترهای توری پراشی با استفاده از الگوریتم های تکاملی

چکیده: فیلترهای توری پراشی نوع جدیدی از فیلترهای نوری هستند که بر مبنای تشدیدی مود هدایت­شده هستند و دارای کاربردهای روزافزونی در آشکارسازها، پردازشگرهای نوری، تزویج­کننده­ها و غیره هستند. هدف از طراحی این فیلترها انتخاب مناسب پارامترهای هندسی است. با انتخاب دقیق این پارامترها، فیلترهایی با بازدهی بالا در یک فرکانس رزونانس طراحی می­شوند. طراحی این فیلترها با ویژگی­های طیفی دقیق موضوعی جالب و در...

متن کامل

طبقه بندی تراکم توده های جنگلی با استفاده از تصویر ماهوارۀ IRS و الگوریتم ناپارامتریک kNN

برآوردهای کمّی و دقیق از مشخصه‌های توده‌های جنگلی لازمه مدیریت صحیح آنها است. تصاویر سنجش از دور با توجه به اطلاعات مکانی دقیق و وسیع، همواره ابزاری مقرون به صرفه در مدیریت جنگل است و یکی از متداول‌ترین کاربردهای تصاویر در علم جنگلداری، طبقه‌بندی مشخصه‌های توده‌های جنگلی و تهیۀ نقشه‌های موضوعی آنها است. هدف این پژوهش بهینه‌سازی طبقه‌بندی تراکم (تعداد درختان در هکتار) در توده‌های جنگلی با استفاده...

متن کامل

طبقه بندی سنگ ‏های ساختمانی از دیدگاه قابلیت برش با استفاده از روش خوشه بندی فازی

پیش بینی قابلیت برش سنگ به عنوان یکی از فاکتورهای موثر در تخمین هزینه‏ها و پیش بینی میزان تولید یک کارخانه فرآوری سنگ از اهمیت بالایی برخوردار می‏باشد. بنابراین شناخت کامل سنگ‏های ساختمانی و ارزیابی توان اجرایی دستگاه‏های برش در کارخانه‏های فرآوری، طراحان و برنامه‏ریزان تولید را به سمت بهبود سرعت فرآوری و افزایش تولید سوق می‏دهد. از اینرو، به کارگیری روش‏های نو و کاربردی برای دست‏یابی به این اه...

متن کامل

مقایسه ی الگوریتم های مختلف طبقه بندی داده ها برای تعیین نوع زردی در نوزادان

Background and Aim: Neonatal jaundice is a matter that is very important for clinicians all over the world because this disease is one of the most common cases that requires clinical care. The aim of this study is to use data classification algorithms to predict the type of jaundice in neonates, and therefore, to prevent irreparable damages in future. Materials and Methods: This is a descripti...

متن کامل

انتخاب ژن و طبقه بندی سلول های سرطانی بر پایه داده های ریزآرایه با استفاده از الگوریتم ترکیبی BPSO و BLDA

داده های ریزآرایه در تشخیص و طبقه بندی انواع بافت های سرطانی نقش بسزایی دارند. در پژوهش های سرطان همیشه تعداد نسبتا کم نمونه ها در ریزآرایه باعث ایجاد مشکلاتی در طراحی طبقه بندها شده است. بنابراین داده های ریزآرایه قبل از طبقه بندی از طریق تکنیک های انتخاب ژن پیش پردازش و ژن های فاقد اطلاعات آن ها دور ریخته می شود. اساسا یک روش انتخاب ژن مناسب می تواند بطور موثر کارایی دسته بندی بیماری ها (سرطا...

متن کامل

بهبود کلاس بندی داده های نامتوازن با استفاده از الگوریتم های یادگیری ماشین

در دنیای امروز مسئله کلاس بندی داده های نا متوازن از اهمیت خاصی برخوردار است . کلاس بندی این داده ها به گونه ای است که ، کلاسی که از نظر دامنه کاربرد اهمیت زیادی دارد (کلاس اقلیت ) شامل تعداد حالات کمتری نسبت به کلاسی است که از اهمیت خاصی برخوردار نیست (کلاس اکثریت). به این مجموعه داده ها داده های نامتوازن می گویند. روش های مختلفی برای کلاس بندی این نوع داده ها ارائه شده است .در کلاس بندی این د...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023